# 导包
from bs4 import BeautifulSoup

# 待解析的html文件
html = """
    <html>
        <head>
            <title>黑马程序员</title>
        </head>
        <body>
            <p id="test01">软件测试</p>
            <p id="test02">2020年</p>
            <a href="/api.html">接口测试</a>
            <a href="/web.html">Web自动化测试</a>
            <a href="/app.html">APP自动化测试</a>
        </body>
    </html>
"""
# 实例化
# markup：表示待解析的html格式字符串或文件对象
# features：表现待解析的文件特征（特定类型） ，如果是html文件，直接使用"html.parser"
bs = BeautifulSoup(markup=html, features="html.parser")
# 调用方法
# 1.获取单个标签 : 对象.标签名
print(bs.p)  # <p id="test01">软件测试</p>
# 2.获取标签属性值：对象.标签名.get("属性名")
print(bs.p.get("id"))  # test01
# 3.获取标签的文本信息：对象.标签名.string
print(bs.p.string)  # 软件测试
# 4.获取所有标签：对象.find_all("标签名")
print(bs.find_all("p")) # [<p id="test01">软件测试</p>, <p id="test02">2020年</p>]

# 思考：获取所有的a标签
print(bs.find_all("a"))
# 获取：/api.html
print(bs.a.get("href"))
